Maximum Likelihood Estimation (MLE)

Big Data and Analytics - পরিসংখ্যান (Statistics) - Statistical Inference এবং Decision Making
429

Maximum Likelihood Estimation (MLE) হল একটি পরিসংখ্যানিক পদ্ধতি যা ডেটার ভিত্তিতে এক বা একাধিক অজানা প্যারামিটার অনুমান করতে ব্যবহৃত হয়। এই পদ্ধতিটি একটি নির্দিষ্ট পরিসংখ্যানিক মডেল বা বণ্টন অনুযায়ী ডেটার জন্য সর্বাধিক সম্ভাব্যতা (likelihood) বের করে, এবং সেই অনুযায়ী সঠিক প্যারামিটার অনুমান করে। সহজ ভাষায়, MLE হল এমন একটি পদ্ধতি যার মাধ্যমে আমরা সেই প্যারামিটারগুলিকে খুঁজে বের করি যা আমাদের পর্যবেক্ষিত ডেটাকে সর্বাধিক সম্ভাবনা প্রদান করবে।


MLE এর মৌলিক ধারণা:

Likelihood Function (সম্ভাবনা ফাংশন) হল সেই ফাংশন যা কোনও প্যারামিটার দিয়ে ডেটার জন্য সম্ভাবনা প্রদান করে। MLE তে, আমরা আমাদের মডেল বা বণ্টনের প্যারামিটারসমূহ এমনভাবে নির্ধারণ করতে চাই যাতে এই সম্ভাবনা সর্বাধিক হয়।

গাণিতিক সংজ্ঞা:

ধরা যাক, X1,X2,,XnX_1, X_2, \dots, X_n একটি নমুনা এবং আমাদের θ\theta (যেমন, গড়, স্ট্যান্ডার্ড ডেভিয়েশন, প্যারামিটার) এর জন্য MLE নির্ধারণ করতে হবে। তাহলে, Likelihood Function L(θ)L(\theta) হবে:

L(θ)=P(X1=x1,X2=x2,,Xn=xnθ)L(\theta) = P(X_1 = x_1, X_2 = x_2, \dots, X_n = x_n | \theta)

এটি হলো যতটা সম্ভব θ\theta-এর মান বের করা যাতে L(θ)L(\theta) সর্বাধিক হয়।

এবং, log-likelihood function হবে:

(θ)=logL(θ)\ell(\theta) = \log L(\theta)

এটি ব্যবহৃত হয় কারণ লঘু ফাংশন সাধারণত গাণিতিকভাবে সহজ হয় এবং এটি গাণিতিক হিসাব করার জন্য সুবিধাজনক।

MLE সূত্র:

  1. প্রথমে, Likelihood Function নির্ধারণ করতে হবে।
  2. পরবর্তীতে, log-likelihood function ব্যবহার করে এর ডেরিভেটিভ বের করতে হবে।
  3. সেই ডেরিভেটিভকে শূন্যে সমাধান করলে, প্রাপ্ত মান θ^\hat{\theta} হল সেই প্যারামিটার অনুমান যা সর্বাধিক সম্ভাবনা প্রদান করে।

MLE এর ব্যবহার:

MLE এর ব্যবহার বেশিরভাগ ক্ষেত্রেই পরিসংখ্যানিক মডেলগুলিতে, যেমন ডিস্ট্রিবিউশন মডেল, সিম্পল লিনিয়ার রিগ্রেশন, এবং অনেক উন্নত মডেলে দেখা যায়। এটি অনেক ক্ষেত্রেই সবচেয়ে শক্তিশালী এবং সাধারণ পদ্ধতি হিসাবে ব্যবহৃত হয়, কারণ এটি অসীম স্যাম্পল সাইজ এর জন্য সঠিক প্যারামিটার অনুমান প্রদান করে।

ব্যবহার উদাহরণ:

  1. Normal Distribution: যদি আমাদের একটি সাধারণ নরমাল বণ্টন থাকে, যেখানে গড় μ\mu এবং স্ট্যান্ডার্ড ডেভিয়েশন σ\sigma অজানা, তবে MLE পদ্ধতি ব্যবহার করে আমরা μ\mu এবং σ\sigma-এর জন্য সবচেয়ে সম্ভাব্য মান বের করতে পারি।
    • Likelihood Function হবে: L(μ,σ)=i=1n1σ2πexp((xiμ)22σ2)L(\mu, \sigma) = \prod_{i=1}^n \frac{1}{\sigma \sqrt{2\pi}} \exp\left(-\frac{(x_i - \mu)^2}{2\sigma^2}\right)
    • তারপর, log-likelihood ফাংশন নিয়ে এর ডেরিভেটিভ সমাধান করলে, আমাদের প্রাপ্ত হবে: μ^=1ni=1nxi(sample mean)\hat{\mu} = \frac{1}{n} \sum_{i=1}^n x_i \quad \text{(sample mean)} σ^2=1ni=1n(xiμ^)2(sample variance)\hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \hat{\mu})^2 \quad \text{(sample variance)}
    • এটি দেখায় যে, sample mean এবং sample variance MLE এর মাধ্যমে আসল প্যারামিটার অনুমান দেয়।
  2. Poisson Distribution: যদি আমাদের Poisson distribution এর জন্য প্যারামিটার λ\lambda এর জন্য MLE বের করতে হয়, তাহলে, X1,X2,,XnX_1, X_2, \dots, X_n হল সেই ডেটা যা Poisson distribution অনুসরণ করে।
    • Likelihood Function হবে: L(λ)=i=1nλxieλxi!L(\lambda) = \prod_{i=1}^n \frac{\lambda^{x_i} e^{-\lambda}}{x_i!}
    • তারপর, log-likelihood ফাংশন নিয়ে এর ডেরিভেটিভ সমাধান করলে, প্রাপ্ত হবে: λ^=1ni=1nxi\hat{\lambda} = \frac{1}{n} \sum_{i=1}^n x_i
    • এটি দেখায় যে, λ^\hat{\lambda} হল গড় (mean) যা Poisson distribution এর জন্য MLE।
  3. Linear Regression: যদি আমরা লিনিয়ার রিগ্রেশন মডেল ব্যবহার করি যেখানে y=β0+β1x+ϵy = \beta_0 + \beta_1 x + \epsilon (এখানে ϵ\epsilon হল ত্রুটি), তবে MLE ব্যবহার করে β0\beta_0 এবং β1\beta_1-এর জন্য অনুমান বের করা যায়।
    • এখানে ϵ\epsilon সাধারণত গড় 00 এবং বৈচিত্র্য σ2\sigma^2-এর সাথে একটি নরমাল বণ্টন ফলো করে।
    • MLE পদ্ধতিতে, আমরা least squares সমস্যার সমাধান পাবো, যা β0\beta_0 এবং β1\beta_1-এর জন্য সবচেয়ে সম্ভাব্য মান দেয়।

MLE এর সুবিধা এবং অসুবিধা:

সুবিধা:

  1. অপারেটর সম্পূর্ণতা (Consistency): MLE সাধারণত বড় নমুনা সাইজে সঙ্গত (consistent) অনুমান দেয়, অর্থাৎ নমুনা সাইজ বাড়ালে এটি আসল প্যারামিটারের কাছাকাছি চলে আসে।
  2. বড় নমুনা সাইজে কার্যকর (Efficiency): MLE বড় নমুনা সাইজে অ্যাসিম্পটোটিক্যালি অদ্বিতীয় (asymptotically efficient) হয়, অর্থাৎ এটি অন্যান্য পদ্ধতির তুলনায় কম ভ্যারিয়েন্সের সাথে সবচেয়ে সঠিক অনুমান প্রদান করে।
  3. সহজ এবং গাণিতিকভাবে শক্তিশালী: MLE গণনা করা সহজ এবং এটি অনেক পরিস্থিতিতে গাণিতিকভাবে শক্তিশালী এবং প্যারামিটার অনুমান করতে সাহায্য করে।

অসুবিধা:

  1. কম নমুনার জন্য কার্যকরী নয়: ছোট নমুনায় MLE কার্যকরী নাও হতে পারে। এটি বড় ডেটাসেটের জন্য উপযুক্ত।
  2. অবশ্যই সঠিক মডেল হতে হবে: MLE পদ্ধতি খুবই নির্ভরশীল যে, আপনার মডেল সঠিকভাবে নির্ধারিত হয়েছে। যদি মডেল ভুল হয়, তবে অনুমানও ভুল হতে পারে।
  3. গণনা জটিলতা: কিছু পরিস্থিতিতে, MLE এর জন্য গণনা জটিল হতে পারে এবং সমাধান পাওয়া কঠিন হতে পারে।

সারাংশ

Maximum Likelihood Estimation (MLE) একটি পরিসংখ্যানিক পদ্ধতি যা একটি নির্দিষ্ট প্যারামিটার অনুমান করার জন্য ব্যবহৃত হয়, যাতে ডেটার জন্য সর্বাধিক সম্ভাবনা পাওয়া যায়। এটি মূলত ডেটার উপর ভিত্তি করে প্যারামিটার নির্ধারণে ব্যবহৃত হয় এবং এটি সঙ্গত এবং দক্ষ পদ্ধতি হিসেবে কাজ করে। যদিও MLE বড় নমুনায় খুব কার্যকর, তবে ছোট নমুনা সাইজ এবং ভুল মডেল ব্যবহারের ক্ষেত্রে কিছু সীমাবদ্ধতা থাকতে পারে।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...